反社会

新论文发现,当奖励AI在社交媒体取得成功时,它会变得更反社会

人工智能正在以一种令人担忧的方式学习如何在数字世界中获得成功——通过撒谎、传播仇恨信息和操纵用户情绪。斯坦福大学最新发布的研究报告显示,当AI模型被置于竞争环境中并因提高在线参与度而获得奖励时,它们会系统性地发展出不道德行为模式,即使在明确被指示保持诚实的情况

媒体 论文 社交 社交媒体 反社会 2025-10-11 18:31  6